线性映射

线性代数
	向量 · 向量空间 · 基底 · 行列式 · 矩阵
向量
	标量 · 向量 · 向量空间 · 向量投影 · 外积（向量积 · 七维向量积） · 内积（数量积） · 二重向量
矩阵与行列式
	矩阵 · 行列式 · 线性方程组 · 秩 · 核 · 迹 · 单位矩阵 · 初等矩阵 · 方块矩阵 · 分块矩阵 · 三角矩阵 · 非奇异方阵 · 转置矩阵 · 逆矩阵 · 对角矩阵 · 可对角化矩阵 · 对称矩阵 · 反对称矩阵 · 正交矩阵 · 幺正矩阵 · 埃尔米特矩阵 · 反埃尔米特矩阵 · 正规矩阵 · 伴随矩阵 · 余因子矩阵 · 共轭转置 · 正定矩阵 · 幂零矩阵 · 矩阵分解（LU分解 · 奇异值分解 · QR分解 · 极分解 · 特征分解） · 子式和余子式 · 拉普拉斯展开 · 克罗内克积
线性空间与线性变换
	线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 线性无关 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化
	查; 论; 编;

线性映射（英语：linear map）是向量空间之间，保持向量加法和标量乘法的函数。线性映射也是向量空间作为模的同态^[1]。

线性算子（英语：linear operator）与线性变换（英语：linear transformation）是与线性映射相关的惯用名词，但其实际意义存在许多分歧，详见相关名词一节。

正式定义[编辑]

设 $V$ 和 $W$ 都是系数体为 $K$ 的向量空间， $f:V\to W$ 是一个从 $V$ 送到 $W$ 的一个映射。如果 $f$ 具有以下两个性质：

维持向量加法——对于任意两个 $V$ 中的向量 $x$ 和 $y$ ： $f(x+y)=f(x)+f(y)$
维持标量乘法——对于任何 $V$ 中的向量 $x$ 和任何标量 $a\in K$ ： $f(a\cdot x)=a\cdot f(x)$

则称 $f$ 是一个 $K$ -线性映射。在系数体不致混淆的情况下也经常简称线性映射。

这等价于要求 $f$ 对任意向量 $x_{1},\,\ldots ,\,x_{m}\in V$ 和任意标量 $a_{1},\,\ldots ,\,a_{m}\in K$ ：

f(a_{1}\cdot x_{1}+\cdots +a_{m}\cdot x_{m})=a_{1}\cdot f(x_{1})+\cdots +a_{m}\cdot f(x_{m})

线性泛函[编辑]

任何的体 $K$ 本身就是一维的（系数为自身的）向量空间，所以可以考虑任何从系数体同样为 $K$ 的向量空间 $V$ 送往 $K$ 的线性映射，这类线性映射被称为线性泛函。研究线性泛函的学科是线性泛函分析，是泛函分析最成熟的分支。

注意事项[编辑]

线性映射中的“线性”与“函数图形是直线”没有任何关联。

定义域和到达域相同的线性映射可以进行函数合成，合成的结果依然会是线性映射。但是如果改变合成的顺序，那合成出来的结果通常不会相同。例如“把函数乘上 $x^{2}$ ”和“对函数进行微分”都是线性算子，但是对一个函数“先乘上 $x^{2}$ 再进行微分”和“先进行微分再乘上 $x^{2}$ ”是不同的线性映射。^[2]

维持向量加法的映射可能不维持标量乘法；同样地，维持标量乘法的映射也可能不维持向量加法。^[3]

例子[编辑]

恒等映射和零映射是线性的。^[9]

对于实数，映射 $x\mapsto x^{2}$ 不是线性的。

如果 $A$ 是 $m\times n$ 实矩阵，则 $A$ 定义了一个从 $R^{n}$ 到 $R^{m}$ 的线性映射，这个映射将列向量 $x\in R^{n}$ 映射到列向量 $Ax\in R^{m}$ 。反过来说，在有限维向量空间之间的任何线性映射都可以用这种方式表示；参见后面章节。

积分生成从在某个区间上所有可积分实函数的空间到 $R$ 的线性映射。这只是把积分的基本性质（“积分的可加性”和“可从积分号内提出常数倍数”）用另一种说法表述出来。^[9]

微分是从所有可微分函数的空间到所有函数的空间的线性映射。^[9]

“给函数乘上 $x^{2}$ ”是一种线性映射。^[9]设 $C$ 是由全体连续函数所组成的函数空间，则此运算也是空间 $C$ 中的算子。

后向移位（backward shift）运算是一种线性映射。即把无穷维向量 $(x_{1},x_{2},x_{3},x_{4},...)$ 的第一个坐标划去： $\operatorname {T} (x_{1},x_{2},x_{3},x_{4},...)=(x_{2},x_{3},x_{4},...)$ 。^[9]

如果 $V$ 和 $W$ 为在体 $F$ 上的有限维向量空间，则从线性映射 $f:V\rightarrow W$ 到在后面所描述的 $\dim _{F}(W)\times \dim _{F}(V)$ 矩阵的函数也是线性映射。^[9]

一次函数 $y=f(x)=x+b$ 仅在 $b=0$ 时才是一种线性变换。容易验证一次函数仅在 $b=0$ 时，线性变换的基本性质 $f(0)=0$ 才能成立。（尽管 $b\neq 0$ 时其图像也是一条直线，但这里所说的线性不是指函数图像为直线。）同理，平移变换一般也不是线性变换（平移距离为零时才是线性变换）。^[10]^[11]

矩阵[编辑]

若 $V$ 和 $W$ 是有限维的、有相同的系数体 $K$ 的向量空间，则从 $V$ 到 $W$ 的线性映射可以用矩阵表示。

以矩阵表示线性映射[编辑]

假设 $T:V\to W$ 是个线性映射，且

{\mathfrak {B}}_{V}=\left\{\alpha _{1},\alpha _{2},\,\ldots ,\alpha _{n}\right\}

{\mathfrak {B}}_{W}=\left\{\beta _{1},\beta _{2},\,\ldots ,\beta _{m}\right\}

分别是 $V$ 和 $W$ 的基底。

根据基底 ${\mathfrak {B}}_{W}$ 的基本定义，对于每个基向量 $\alpha _{i}\in {\mathfrak {B}}_{V}$ ，存在唯一一组标量 $t_{1i},\,t_{2i},\,\ldots ,\,t_{mi}\in K$ 使得

T(\alpha _{i})=\sum _{j=1}^{m}t_{ji}\cdot \beta _{j}=t_{1i}\cdot \beta _{1}+t_{2i}\cdot \beta _{2}+\cdots +t_{mi}\cdot \beta _{m}

直观上，标量 $t_{1i},\,t_{2i},\,\ldots ,\,t_{mi}\in K$ 就是对基向量 $\alpha _{i}\in {\mathfrak {B}}_{V}$ 的作用结果 $T(\alpha _{i})\in W$ ，在基底 ${\mathfrak {B}}_{W}$ 下的诸分量。

现在任取一个 $V$ 里的向量 $v\in V$ ，因为基底 ${\mathfrak {B}}_{V}$ 的基本定义，存在唯一一组标量 $v_{1},\,v_{2},\,\ldots ,\,v_{n}\in K$ 使得

v=\sum _{i=1}^{n}v_{i}\cdot \alpha _{i}

这样根据求和符号的性质，可以得到

T(v)=\sum _{i=1}^{n}v_{i}\cdot \left(\sum _{j=1}^{m}t_{ji}\cdot \beta _{j}\right)=\sum _{i=1}^{n}\sum _{j=1}^{m}(t_{ji}v_{i})\cdot \beta _{j}=\sum _{j=1}^{m}\sum _{i=1}^{n}(t_{ji}v_{i})\cdot \beta _{j}=\sum _{j=1}^{m}\left(\sum _{i=1}^{n}t_{ji}v_{i}\right)\cdot \beta _{j}

然后考虑到 $T(v)\in W$ ，所以根据基底 ${\mathfrak {B}}_{W}$ 的基本定义，存在唯一一组标量 $\lambda _{1},\,\lambda _{2},\,\ldots ,\,\lambda _{m}\in K$ 使得

T(v)=\sum _{j=1}^{m}\lambda _{j}\cdot \beta _{j}

因为这样的标量 $\lambda _{1},\,\lambda _{2},\,\ldots ,\,\lambda _{M}\in K$ 是唯一存在的，所以对 $j=1,\,2,\,\ldots ,\,m$ 有

\lambda _{j}=\sum _{i=1}^{n}t_{ji}v_{i}

考虑到矩阵乘法的定义，上式可以改写为

{\begin{bmatrix}\lambda _{1}\\\lambda _{2}\\\vdots \\\lambda _{m}\end{bmatrix}}={\begin{bmatrix}t_{11}&t_{12}&\dots &t_{1n}\\t_{21}&t_{22}&\dots &t_{2n}\\\vdots &\vdots &\ddots &\vdots \\t_{m1}&t_{m2}&\dots &t_{mn}\end{bmatrix}}{\begin{bmatrix}v_{1}\\v_{2}\\\vdots \\v_{n}\end{bmatrix}}

也就是说，只要知道 $T(\alpha _{i})$ 在 ${\mathfrak {B}}_{W}$ 下的诸分量 $t_{ji}$ ，任意向量 $v\in V$ 的作用结果 $T(v)$ ，都可以表示为矩阵 $\mathbf {T} ={[t_{ji}]}_{m\times n}$ 与行向量 $\mathbf {v} ={[v_{i}]}_{n\times 1}$ 的乘积。更直观的来说，矩阵 $\mathbf {T} ={[t_{ji}]}_{m\times n}$ 就是把 $T(\alpha _{i})$ 的诸分量沿行（column）摆放所构成的。

由上面的推导可以知道，不同的基底 ${\mathfrak {B}}_{V}$ 和 ${\mathfrak {B}}_{W}$ 下，矩阵 $\mathbf {T} ={[t_{ji}]}_{m\times n}$ 也不同，为了强调这点，也会将矩阵 $\mathbf {T}$ 记为

\mathbf {T} ={[T]}_{{\mathfrak {B}}_{W}}^{{\mathfrak {B}}_{V}}

来强调这种关联性。

若 $T:V\to V$ ，在同个向量空间 $V$ 通常没有取不同基底的必要，那上面的推导可以在 ${\mathfrak {B}}_{V}={\mathfrak {B}}_{W}$ 的前提下进行。这时上式可以进一步简写为

\mathbf {T} ={[T]}_{{\mathfrak {B}}_{V}}

以线性映射表示矩阵[编辑]

若有由 $m\times n$ 个标量构成的矩阵 $\mathbf {A} ={[a_{ij}]}_{m\times n}\in K^{m\times n}$ ，如果取 $f:K^{n\times 1}\to K^{m\times 1}$ 为

f(\mathbf {x} )=\mathbf {A} \mathbf {x}

其中

\mathbf {x} ={\begin{bmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{bmatrix}}\in K^{n\times 1}

因为矩阵乘法只有唯一的结果，上面的定义的确符合函数定义的基本要求。然后考虑 $K^{n\times 1}$ 和 $K^{m\times 1}$ 都可以视为定义在同个标量体 $K$ 上的向量空间，而且矩阵乘法是线性的，所以上述定义的函数 $f$ 的确符合线性映射的基本定义。

用矩阵表示线性映射的原因和好处[编辑]

把线性映射写成具体而简明的2维数阵形式后，就成了一种矩阵。进而由线性映射的加法规则和覆合规则来分别定义矩阵的加法规则和乘法规则是很自然的想法。^[12]当空间的基变化（坐标系变换）时，线性映射的矩阵也会有规律地变化。在特定的基上研究线性映射，就转化为对矩阵的研究。利用矩阵的乘法，可以把一些线性系统的方程表达得更紧凑（比如把线性方程组用矩阵表达和研究），也使几何意义更明显。矩阵可以分块计算，可以通过适当的变换以“解耦”（把覆杂的变换分解为一些简单变换的组合）。要求出一个线性变换的秩，先写出其矩阵形式几乎是不可避免的一个步骤。
遇到 $y=x+3$ 这样的加上了1个常量的非线性映射可以通过增加1个维度的方法，把变换映射写成2×2维的方形矩阵形式，从而在形式上把这一类特殊的非线性映射转化为线性映射。这个办法也适用于处理在高维线性变换上多加了一个常向量的情形。这在计算机图形学和刚体理论（及其相关机械制造和机器人学）中都有大量应用。
对角化的矩阵具有诸多优点。线性映射在写成矩阵后可以进行对角化（不能对角化的矩阵可以化简成接近对角矩阵的准对角矩阵），从而可以获得对角化矩阵拥有的独特优势（极大地简化乘法运算，易于分块，容易看出与基的选取无关的不变量）。比如，对于作用于同一个空间的可对角化的方形矩阵 $A$ ，要求出 $A$ 自乘 $n$ 次后的结果 $A^{n}$ ，一个一个慢慢地乘是很麻烦的事情。而知道对角化技巧的人会发现，在将这矩阵对角化后，其乘法运算会变得格外简单。实际应用中有很多有意思的问题或解题方法都会涉及到矩阵自乘n次的计算，如1阶非齐次线性递推数列通项公式的线性代数求解法和马尔可夫链的极限状态（极限分布）的求解。线性代数及矩阵论的一个主要问题就是寻找可使矩阵对角化的条件或者可使矩阵化简到含很多个0的条件^[13]，以便简化计算（这是主要原因之一）。

线性映射的矩阵的例子[编辑]

二维空间 $R^{2}$ 的线性变换的一些特殊情况有：

逆时针旋转90度：
$A={\begin{bmatrix}0&-1\\1&0\end{bmatrix}}$
逆时针旋转 $\theta$ 度^[14]：
$A={\begin{bmatrix}\cos(\theta )&-\sin(\theta )\\\sin(\theta )&\cos(\theta )\end{bmatrix}}$
针对y轴反射：
$A={\begin{bmatrix}1&0\\0&-1\end{bmatrix}}$
在所有方向上放大2倍：
$A={\begin{bmatrix}2&0\\0&2\end{bmatrix}}$
水平错切：
$A={\begin{bmatrix}1&m\\0&1\end{bmatrix}}$
挤压：
$A={\begin{bmatrix}k&0\\0&1/k\end{bmatrix}}$
向y轴投影：
$A={\begin{bmatrix}0&0\\0&1\end{bmatrix}}$

从给定线性映射构造新的线性映射[编辑]

两个线性映射的覆合映射是线性的：如果 $f:V\rightarrow W$ 和 $g:W\rightarrow Z$ 是线性的，则 $g\circ f:V\rightarrow Z$ 也是线性的。

若线性映射可逆，则该线性映射的逆也是线性映射。

如果 $f_{1}:V\rightarrow W$ 和 $f_{2}:V\rightarrow W$ 是线性的，则它们的和 $f_{1}+f_{2}$ 也是线性的(这是由 $\left(f_{1}+f_{2}\right)\left(x\right)=f_{1}\left(x\right)+f_{2}\left(x\right)$ 定义的)。

如果 $f:V\rightarrow W$ 是线性的，而a是基础体K的一个元素，则定义自 (af)(x) = a (f(x))的映射af也是线性的。

所以从 $V$ 到 $W$ 的线性映射的集合 $L\left(V,W\right)$ 自身形成在 $K$ 上的向量空间，有时指示为 $\mathrm {Hom} \left(V,W\right)$ 。进一步的说，在 $V=W$ 的情况中，这个向量空间(指示为 $\mathrm {End} (V)$ )是在映射覆合下的结合代数，因为两个线性映射的覆合再次是线性映射，所以映射的覆合总是结合律的。

给定有限维的情况，如果基已经选择好了，则线性映射的覆合对应于矩阵乘法，线性映射的加法对应于矩阵加法，而线性映射与标量的乘法对应于矩阵与标量的乘法。

自同态线性映射[编辑]

自同态的线性映射在泛函分析和量子力学中都有很重要的地位。按前文约定，我们用“线性算子”来简称它。（注意泛函分析中所说的“线性算子”不一定是自同态(endomorphism)映射，但我们为了照顾不同书籍的差异以及叙述的方便，暂用“线性算子”来称呼这种自同态。）

自同态和自同构[编辑]

自同态是一个數學對象到它本身的保持结构的映射（同态），例如群 $G$ 的自同态则是群同态 $f:G\to G$ 。对于向量空间 $V$ ，其自同态是线性算子 $f:V\rightarrow V$ ；所有这种自同态的集合 $\mathrm {End} (V)$ 与如上定义的加法、覆合和标量乘法一起形成一个结合代数，带有在体 $K$ 上的单位元(特别是一个环)。这个代数的乘法单位元是恒等映射 $\mathrm {id} :V\rightarrow V$ 。

若 $V$ 的自同态也刚好是同构则称之为自同构。两个自同构的覆合再次是自同构，所以 $V$ 的所有的自同构的集合形成一个群， $V$ 的自同构群可表为 $\mathrm {Aut} (V)$ 或 $\mathrm {GL} (V)$ 。因为自同构正好是那些在覆合运算下拥有逆元的自同态，所以 $\mathrm {Aut} (V)$ 也就是在环 $\mathrm {End} (V)$ 中的可逆元群。

如果 $V$ 之维度 $n$ 有限 $\mathrm {End} (V)$ 同构于带有在 $K$ 中元素的所有 $n\times n$ 矩阵构成的结合代数，且 $V$ 的自同态群同构于带有在 $K$ 中元素的所有 $n\times n$ 可逆矩阵构成的一般线性群 $\mathrm {GL} (n,K)$ 。

量子力学应用[编辑]

核、像和秩-零化度定理[编辑]

对于一个线性映射 $f:V\rightarrow W$ ，可以考虑以下两个：

核（ Kernel ）——送到零向量的那些向量： $\mathrm {Ker} (f):=f^{-1}(\mathbf {0} )=\{x\in V\mid f(x)=\mathbf {0} \}\subseteq V$
像（ Image ）——把整个空间送过去后的结果： $\mathrm {Im} (f):=f(V)=\{f(x)\in W\mid x\in V\}\subseteq W$

那么 $\operatorname {Ker} (f)$ 是 $V$ 的子空间，而 $\operatorname {Im} (f)$ 是 $W$ 的子空间。下面的叫做秩-零化度定理的维度公式经常是有用的：

\dim(\mathrm {Ker} (f))+\dim(\mathrm {Im} (f))=\dim(V)

$\dim(\mathrm {Im} (f))$ 这个数称做“ $f$ 的秩”（ rank ）并写成 $\mathrm {rk} (f)$ ，有时也写成 $\rho (f)$ ；而 $\dim(\mathrm {Ker} (f))$ 这个数则称做“ $f$ 的零化度”（ nullity ）并写成 $v(f)$ 。如果 $V$ 和 $W$ 是有限维的，那么 $f$ 的秩和零化度就是 $f$ 的矩阵形式的秩和零化度。

这个定理在抽象代数的推广是同构定理。

推广[编辑]

多重线性映射是线性映射最重要的推广，它也是格拉斯曼代数和张量分析的数学基础。其特例为双线性映射。

参见[编辑]

脚注与参考资料[编辑]

脚注[编辑]

^ 见Lax 2010，第7页(位于第2章“线性映射”第1节“线性映射生成的代数”)。
^ 见Axler 2009，第41页(位于第3章“线性映射”第1节“定义与例子”)。
^ 见Axler 2009，第59页(位于第3章“线性映射”末尾习题旁的说明)。
^ 见龚昇《线性代数五讲》第1讲第10页。
^ 见Axler 2009，第38页(位于第3章“线性映射”第1节“定义与例子”)。
^ 李尚志. 第6章“線性變換”第4節“線性變換”. 線性代數第1版. 高等教育出版社. 2006: 326. ISBN 7-04-019870-3. 则V到自身的线性映射称为V的线性变换(linear transformation)。
^ А·Н·柯尔莫哥洛夫，佛明(С. В. Фомин). 第4章“線性泛函與線性算子”第5節“線性算子”. Элементы теории функций и функционального анализа [函数论与泛函分析初步]. 俄罗斯数学教材选译. 段虞荣 (翻译)，郑洪深 (翻译)，郭思旭 (翻译) 原书第7版，中译本第2版. 高等教育出版社. 2006年: 162. ISBN 7-04-018407-9.
^ 见Lax 2010，第131页(位于第15章“有界线性映射”的开头部分)。原文为“线性映射也称为线性算子或线性变换”。
^ ^9.0 ^9.1 ^9.2 ^9.3 ^9.4 ^9.5 见Axler 2009，第38-39页(位于第3章“线性映射”第1节“定义与例子”)。
^ 见Artin 2010，第156页。(位于第6章“Symmetry”第1节“ Symmetry of the Plane Figures”)
^ Walter Rudin. 第1章“Topological Vector Spaces”中的“Linear mappings”一節. Functional Analysis [泛函分析]. Higher mathematics series. McGraw-Hill Book Company. 1973: 13.
^ 见Axler 2009，第51页(位于第3章“线性映射”第3节“线性映射的矩阵”)。
^ 见Axler 2009，第82页(位于第5章“本征值与本征向量”第3节“上三角矩阵”)。
^ 其证明只需要用到三角函数的基础知识，在网上很容易找到证明过程。也可参见Feynman第11章“Vectors”第3节“Rotations”。

脚注所引资料[编辑]

Michael Artin. Algebra [代数] 2. Pearson. 2010. ISBN 978-0132413770.
Sheldon Axler. Linear Algebra Done Right [线性代数应该这样学]. 图灵数学•统计学丛书. 杜现昆 (汉译者); 马晶 (汉译者). 人民邮电出版社. 2009. ISBN 9787115206145 （中文（中国大陆））.
Peter D. Lax. Functional Analysis [泛函分析]. 图灵数学·统计学丛书. 侯成军 (翻译); 王利广 (翻译). 人民邮电出版社. 2010. ISBN 978-7-115-23174-1.
Richard Feynman. The Feynman Lectures on Physics [费曼物理学讲义] 1. Addison-Wesley. 1999. ISBN 978-0201021165.

其它参考资料[编辑]

Halmos, Paul R., Finite-Dimensional Vector Spaces, Springer-Verlag, (1993). ISBN 0-387-90093-4.

[1] 见Lax 2010，第7页(位于第2章“线性映射”第1节“线性映射生成的代数”)。

[2] 见Axler 2009，第41页(位于第3章“线性映射”第1节“定义与例子”)。

[3] 见Axler 2009，第59页(位于第3章“线性映射”末尾习题旁的说明)。

[4] 见龚昇《线性代数五讲》第1讲第10页。

[Axler_p38-5] 见Axler 2009，第38页(位于第3章“线性映射”第1节“定义与例子”)。

[李尚志-6] 李尚志. 第6章“線性變換”第4節“線性變換”. 線性代數第1版. 高等教育出版社. 2006: 326. ISBN 7-04-019870-3. 则V到自身的线性映射称为V的线性变换(linear transformation)。

[柯爾莫哥洛夫-7] А·Н·柯尔莫哥洛夫，佛明(С. В. Фомин). 第4章“線性泛函與線性算子”第5節“線性算子”. Элементы теории функций и функционального анализа [函数论与泛函分析初步]. 俄罗斯数学教材选译. 段虞荣 (翻译)，郑洪深 (翻译)，郭思旭 (翻译) 原书第7版，中译本第2版. 高等教育出版社. 2006年: 162. ISBN 7-04-018407-9.

[Lax-8] 见Lax 2010，第131页(位于第15章“有界线性映射”的开头部分)。原文为“线性映射也称为线性算子或线性变换”。

[Axler_page38-39-9] 9.0 ^9.1 ^9.2 ^9.3 ^9.4 ^9.5 见Axler 2009，第38-39页(位于第3章“线性映射”第1节“定义与例子”)。

[10] 见Artin 2010，第156页。(位于第6章“Symmetry”第1节“ Symmetry of the Plane Figures”)

[11] Walter Rudin. 第1章“Topological Vector Spaces”中的“Linear mappings”一節. Functional Analysis [泛函分析]. Higher mathematics series. McGraw-Hill Book Company. 1973: 13.

[12] 见Axler 2009，第51页(位于第3章“线性映射”第3节“线性映射的矩阵”)。

[13] 见Axler 2009，第82页(位于第5章“本征值与本征向量”第3节“上三角矩阵”)。

[14] 其证明只需要用到三角函数的基础知识，在网上很容易找到证明过程。也可参见Feynman第11章“Vectors”第3节“Rotations”。

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]